**L2 노름L2 norm) 벡터 공간에서 벡터의 크기 또는 길이를 측정하는 방법 중 하나로, 선형수학, 기계학습, 신호, 수치해 등 다양한 분야에서 널리 사용되는 중요한 개념이다. L2 노름은 유클리드 노름(Euclidean norm)이라고도 하며, 일반적인 직관적인 '' 개념과 일한다. 이 문서에서는2 노름의의, 수학 표현, 성질, 활용 사례 등을 체계적으로 설명한다.
정의와 수학적 표현
벡터의 L2 노름
$n$차원 실수 벡터 $\mathbf{x} = [x_1, x_2, \dots, x_n]^T$의 L2 노름은 다음과 같이 정의된다:
$$
|\mathbf{x}|2 = \sqrt{\sum{i=1}^{n} x_i^2 = \sqrt{x_1^2 + x_2^2 + \cdots + x_n^2}
]
이는 벡터의 각소를 제곱한 후 합을 구하고, 그 제곱근을 취하는 과정으로, 2차원 또는 3차원 공간의 유클리드 거리 공식을 일반화한 것이다.
예시벡터 $\mathbf{x} = [3, 4]$의2 노름은 다음과 같다:
[
|\mathbf{x}_2 = \sqrt{3^2 + 4^2} =sqrt{9 + 16} = \sqrt{25} =5
]
이 값은 원점에서 점 $(3, 4)$까지의 직선 거리와 동일하다.
L2 노름의 성질
L2 노름은 다음의 노름(norm)의 공리들을 만족한다:
-
비음성성 (Non-negativity):
$\|\mathbf{x}\|_2 \geq 0$, 그리고 $\|\mathbf{x}\|_2 = 0$일 때는 오직 $\mathbf{x} = \mathbf{0}$일 때이다.
-
동차성 (Homogeneity):
임의의 스칼라 $c \in \mathbb{R}$에 대해 $\|c\mathbf{x}\|_2 = |c| \cdot \|\mathbf{x}\|_2$.
-
삼각 부등식 (Triangle Inequality):
$\|\mathbf{x} + \mathbf{y}\|_2 \leq \|\mathbf{x}\|_2 + \|\mathbf{y}\|_2$.
또한, L2 노름은 내적(inner product)과 밀접한 관계가 있다. 벡터 $\mathbf{x}$의 L2 노름은 다음과 같이 내적으로 표현할 수 있다:
[
|\mathbf{x}|_2 = \sqrt{\langle \mathbf{x}, \mathbf{x} \rangle}
]
여기서 $\langle \mathbf{x}, \mathbf{x} \rangle$는 벡터 $\mathbf{x}$와 자기 자신 사이의 내적이다.
벡터의 L2 노름 외에도, 행렬에 대해서도 L2 노름을 정의할 수 있으며, 이는 스펙트럴 노름(Spectral norm)이라고도 한다. 행렬 $A \in \mathbb{R}^{m \times n}$의 L2 노름은 다음과 같이 정의된다:
[
|A|2 = \max{\mathbf{x} \neq \mathbf{0}} \frac{|A\mathbf{x}|_2}{|\mathbf{x}|_2}
]
이는 행렬이 벡터를 변환할 때 벡터의 길이를 최대 몇 배까지 늘릴 수 있는지를 나타내는 값이다.
또한, 이 값은 행렬 $A$의 특이값 분해(SVD)에서 가장 큰 특이값(singular value)과 같다:
[
|A|2 = \sigma{\max}(A)
]
응용 분야
1. 기계학습: 정규화 (Regularization)
L2 노름은 기계학습에서 L2 정규화(또는 리지 회귀, Ridge Regression)에 사용된다. 손실 함수에 가중치 벡터 $\mathbf{w}$의 L2 노름의 제곱을 추가함으로써, 모델의 복잡도를 제어하고 과적합(overfitting)을 방지한다.
손실 함수 예시:
[
\mathcal{L}(\mathbf{w}) = \text{MSE} + \lambda |\mathbf{w}|_2^2
]
여기서 $\lambda$는 정규화 강도를 조절하는 하이퍼파라미터이다.
2. 거리 측정
L2 노름은 두 벡터 간의 유클리드 거리 측정에 사용된다:
[
d(\mathbf{x}, \mathbf{y}) = |\mathbf{x} - \mathbf{y}|_2
]
이는 클러스터링, 분류, 유사도 분석 등에서 기본적인 거리 척도로 활용된다.
신호의 에너지를 계산할 때 L2 노름의 제곱을 사용한다. 예를 들어, 신호 $\mathbf{x}$의 에너지는 $\|\mathbf{x}\|_2^2$로 정의된다.
관련 노름과 비교
| 노름 종류 |
정의 |
특징 |
| L1 노름 |
$\|\mathbf{x}\|_1 = \sum |x_i|$ |
희소성 유도, 이상치에 덜 민감 |
| L2 노름 |
$\|\mathbf{x}\|_2 = \sqrt{\sum x_i^2}$ |
매끄러운 함수, 기하학적 해석 명확 |
| L∞ 노름 |
$\|\mathbf{x}\|_\infty = \max |x_i|$ |
최대 절댓값, 로버스트함 |
L2 노름은 미분 가능하고 연속적이기 때문에 최적화 문제에서 수치적으로 안정적이다.
참고 자료 및 관련 문서
L2 노름은 현대 수학과 응용 과학의 기초 개념 중 하나로, 이론적 엄밀성과 실용적 유용성을 동시에 갖추고 있다.
# L2 노름## 개요
**L2 노름L2 norm) 벡터 공간에서 벡터의 크기 또는 길이를 측정하는 방법 중 하나로, 선형수학, 기계학습, 신호, 수치해 등 다양한 분야에서 널리 사용되는 중요한 개념이다. L2 노름은 유클리드 노름(Euclidean norm)이라고도 하며, 일반적인 직관적인 '' 개념과 일한다. 이 문서에서는2 노름의의, 수학 표현, 성질, 활용 사례 등을 체계적으로 설명한다.
---
## 정의와 수학적 표현
### 벡터의 L2 노름
$n$차원 실수 벡터 $\mathbf{x} = [x_1, x_2, \dots, x_n]^T$의 **L2 노름**은 다음과 같이 정의된다:
$$
\|\mathbf{x}\|_2 = \sqrt{\sum_{i=1}^{n} x_i^2 = \sqrt{x_1^2 + x_2^2 + \cdots + x_n^2}
\]
이는 벡터의 각소를 제곱한 후 합을 구하고, 그 제곱근을 취하는 과정으로, 2차원 또는 3차원 공간의 유클리드 거리 공식을 일반화한 것이다.
### 예시벡터 $\mathbf{x} = [3, 4]$의2 노름은 다음과 같다:
\[
\|\mathbf{x}\_2 = \sqrt{3^2 + 4^2} =sqrt{9 + 16} = \sqrt{25} =5
\]
이 값은 원점에서 점 $(3, 4)$까지의 직선 거리와 동일하다.
---
## L2 노름의 성질
L2 노름은 다음의 노름(norm)의 공리들을 만족한다:
1. **비음성성 (Non-negativity)**:
$\|\mathbf{x}\|_2 \geq 0$, 그리고 $\|\mathbf{x}\|_2 = 0$일 때는 오직 $\mathbf{x} = \mathbf{0}$일 때이다.
2. **동차성 (Homogeneity)**:
임의의 스칼라 $c \in \mathbb{R}$에 대해 $\|c\mathbf{x}\|_2 = |c| \cdot \|\mathbf{x}\|_2$.
3. **삼각 부등식 (Triangle Inequality)**:
$\|\mathbf{x} + \mathbf{y}\|_2 \leq \|\mathbf{x}\|_2 + \|\mathbf{y}\|_2$.
또한, L2 노름은 내적(inner product)과 밀접한 관계가 있다. 벡터 $\mathbf{x}$의 L2 노름은 다음과 같이 내적으로 표현할 수 있다:
\[
\|\mathbf{x}\|_2 = \sqrt{\langle \mathbf{x}, \mathbf{x} \rangle}
\]
여기서 $\langle \mathbf{x}, \mathbf{x} \rangle$는 벡터 $\mathbf{x}$와 자기 자신 사이의 내적이다.
---
## 행렬의 L2 노름 (스펙트럴 노름)
벡터의 L2 노름 외에도, 행렬에 대해서도 L2 노름을 정의할 수 있으며, 이는 **스펙트럴 노름**(Spectral norm)이라고도 한다. 행렬 $A \in \mathbb{R}^{m \times n}$의 L2 노름은 다음과 같이 정의된다:
\[
\|A\|_2 = \max_{\mathbf{x} \neq \mathbf{0}} \frac{\|A\mathbf{x}\|_2}{\|\mathbf{x}\|_2}
\]
이는 행렬이 벡터를 변환할 때 벡터의 길이를 최대 몇 배까지 늘릴 수 있는지를 나타내는 값이다.
또한, 이 값은 행렬 $A$의 **특이값 분해**(SVD)에서 가장 큰 특이값(singular value)과 같다:
\[
\|A\|_2 = \sigma_{\max}(A)
\]
---
## 응용 분야
### 1. 기계학습: 정규화 (Regularization)
L2 노름은 기계학습에서 **L2 정규화**(또는 리지 회귀, Ridge Regression)에 사용된다. 손실 함수에 가중치 벡터 $\mathbf{w}$의 L2 노름의 제곱을 추가함으로써, 모델의 복잡도를 제어하고 과적합(overfitting)을 방지한다.
손실 함수 예시:
\[
\mathcal{L}(\mathbf{w}) = \text{MSE} + \lambda \|\mathbf{w}\|_2^2
\]
여기서 $\lambda$는 정규화 강도를 조절하는 하이퍼파라미터이다.
### 2. 거리 측정
L2 노름은 두 벡터 간의 유클리드 거리 측정에 사용된다:
\[
d(\mathbf{x}, \mathbf{y}) = \|\mathbf{x} - \mathbf{y}\|_2
\]
이는 클러스터링, 분류, 유사도 분석 등에서 기본적인 거리 척도로 활용된다.
### 3. 신호 처리
신호의 에너지를 계산할 때 L2 노름의 제곱을 사용한다. 예를 들어, 신호 $\mathbf{x}$의 에너지는 $\|\mathbf{x}\|_2^2$로 정의된다.
---
## 관련 노름과 비교
| 노름 종류 | 정의 | 특징 |
|----------|------|------|
| L1 노름 | $\|\mathbf{x}\|_1 = \sum |x_i|$ | 희소성 유도, 이상치에 덜 민감 |
| L2 노름 | $\|\mathbf{x}\|_2 = \sqrt{\sum x_i^2}$ | 매끄러운 함수, 기하학적 해석 명확 |
| L∞ 노름 | $\|\mathbf{x}\|_\infty = \max |x_i|$ | 최대 절댓값, 로버스트함 |
L2 노름은 미분 가능하고 연속적이기 때문에 최적화 문제에서 수치적으로 안정적이다.
---
## 참고 자료 및 관련 문서
- [노름 (수학)](https://ko.wikipedia.org/wiki/노름_(수학))
- [선형대수학](https://ko.wikipedia.org/wiki/선형대수학)
- [특이값 분해 (SVD)](https://ko.wikipedia.org/wiki/특이값_분해)
- [정규화 (기계학습)](https://ko.wikipedia.org/wiki/정규화_(기계학습))
L2 노름은 현대 수학과 응용 과학의 기초 개념 중 하나로, 이론적 엄밀성과 실용적 유용성을 동시에 갖추고 있다.